Сигналы и мотивы 3

PSI-BLAST

Для выполнения этого задания я выбрала белок с AC Q7VDL2. Это Probable septum site-determining protein MinC(белок, определяющий вероятные сайты септ). Ингибитор клеточного деления, который блокирует образование полярных Z-кольцевых перегородок. Организм- Prochlorococcus marinus, недавно обнаруженная цианобактерия (1988), является наименьшим из известных свободноживущих фотосинтетических прокариот.

Таблица итераций

Судя по таблице можно сказать, что итерации стабилизовались уже на четвертой. E-value худшей "правильной" находкой и "лучшей" неправильной достаточно сильно отличается, значит находки возможно составляют семейство гомологичных белков.

Эндонуклеазы рестрикции

В этой части практикума требуется попробовать предсказать специфичность эндонуклеаз рестрикции в геноме Prochlorococcus marinus.

С поомщью команды cut -f5 /P/y18/term4/pr8/TypeII_REs.tsv>sites.txt я получила список сайтов, а затем, командой sort -u sites.txt>sorted_sites.txt, удалила все неуникальные последовательности. Вручную я удалила однобуквенные сайты(такой был только один) и заголовок.

Список сайтов

Затем нужно было отобрать недопредставленные сайты. Можно сделать это методом Карлина. Сначала я использовала команду cbcalc -s sorted_sites.txt -o out_cbcalc.tsv -m 1 -K genome_pr8. Геном бактерии Prochlorococcus marinus был взят с NCBI. В итоге получилась таблица с ожидаемыми и наблюдаемыми сайтами в выбранном геноме.

Таблица 1

Дальше, с помощью команды sort -k5,5g out_cbcalc.tsv | sed '/0.8/,$d' >> out2.tsv (порог на контраст я взяла 0.8), я получила таблицу с недопредставленными сайтами.

Таблица 2

Осталось только получить список экспериментально проверенных эндонуклеаз рестрикции, известная специфичность которых соответствует этим недопредставленным сайтам. С помощью электронных таблиц я выбрала все строки со значением Putative 'no' и сделала поиск по нужным сайтам. Таких эндонуклеаз со значением 'no' в таблице не оказалось. Возможно, так произошло из-за того, что ранее выбранный порог 0.8 слишком мал, и сайтов ниже него было недостаточно.

Тогда я решила немного увеличить порог до 0.9. И в итоге получила 8 эндонкулеаз рестрикции.

Таблица 3 (таблица недопредставленных сатйов для второй попытки)

Итоговая таблица с эндонуклеазами.

Таблица 4